home *** CD-ROM | disk | FTP | other *** search
/ Chip 1997 March / CHIP Mart 1997.iso / SesProg / ESPCH10.ZIP / MANUAL.DOC < prev    next >
Encoding:
Text File  |  1995-04-14  |  9.8 KB  |  293 lines

  1.  
  2.  
  3.  
  4.  
  5.  
  6.  
  7.  
  8.  
  9.  
  10.  
  11.                            ECHOSPEECH
  12.                                 
  13.                                 
  14.          High Quality Speech Compression for Multimedia
  15.                                 
  16.                                 
  17.                         Shareware Manual
  18.  
  19.  
  20.  
  21.  
  22.  
  23.  
  24.  
  25.  
  26.  
  27.  
  28.  
  29.  
  30.  
  31.  
  32.  
  33.  
  34.  
  35.                     Echo Speech Corporation
  36.                     6460 Via Real
  37.                     Carpinteria, CA  93013
  38.                     
  39.                     Phone: 805/684-4593
  40.                     FAX:   805/684-6628
  41. Copyright 1994-1995 Echo Speech Corporation.  All Rights
  42. Reserved.
  43.  
  44. No part of this publication may be reproduced, transmitted,
  45. transcribed, stored in a retrieval system, or translated into any
  46. other language or computer language in whole or in part, in any
  47. form or by any means, whether it be electronic, mechanical,
  48. magnetic, optical, manual or otherwise, without prior written
  49. consent of Echo Speech Corporation.
  50.  
  51. Echo Speech Corporation disclaims all warranties as to this
  52. software, whether express or implied, including without
  53. limitation any implied warranties of merchantability, fitness for
  54. a particular purpose, functionality, data integrity or
  55. protection.
  56.  
  57. ECHOSPEECH is a trademark of Echo Speech Corporation.
  58.  
  59. MS-DOS and Microsoft Windows are trademarks of Microsoft
  60. Corporation.
  61.  
  62. See the file REGISTER.DOC for information about the benefits of
  63. registering ECHOSPEECH.
  64. What's ECHOSPEECH?
  65.  
  66. ECHOSPEECH is the first speech compression algorithm designed
  67. primarily for multimedia applications.  Other speech compression
  68. algorithms were designed for communications systems, like digital
  69. cellular phones or military radios, so they only provide the same
  70. narrow frequency response as a telephone, and they generally need
  71. special hardware to run.
  72.  
  73. We at Echo Speech Corporation are in the multimedia business, so
  74. we designed ECHOSPEECH -- efficient, high-quality, cross-platform
  75. speech compression for multimedia.  ECHOSPEECH preserves
  76. frequencies up to 5500 Hz, so the output sounds crisp, clear and
  77. understandable.  ECHOSPEECH can play back speech in real time on
  78. anything faster than a 386SX/16, with no need for a math
  79. coprocessor.  ECHOSPEECH decompression is also available for the
  80. Macintosh, making it the first cross-platform speech compression
  81. package.
  82.  
  83. ECHOSPEECH reduces the amount of storage space required for 16-
  84. bit speech by a factor of more than 13 to 1, with very little
  85. noticeable degradation in perceived quality.  For example, for
  86. 16-bit speech sampled at 11.025 KHz, ECHOSPEECH reduces the
  87. storage required for a second of speech from 22,050 bytes to
  88. 1,650 bytes.
  89.  
  90.  
  91. Installation
  92.  
  93. This shareware version of ECHOSPEECH consists of two main
  94. programs which run under MS-DOS.  One program is a speech
  95. compression program called WAV2ES.EXE, which reads a Microsoft
  96. Windows .wav file and generates a compressed speech file which
  97. also has the file name extension .WAV.
  98.  
  99. The other program is called ES2WAV.EXE.  It reads the compressed
  100. .WAV file and generates an uncompressed output file in .WAV
  101. format.
  102.  
  103. Although the file name extension of the compressed speech file is
  104. .WAV, and the file complies with Microsoft's .WAV file format, it
  105. contains compressed ECHOSPEECH data, and must be manually
  106. decompressed with ES2WAV.EXE before it can be played back.
  107.  
  108. This decompression can be done automatically "on the fly" with
  109. the ECHOSPEECH Audio Compression Manager files which are part of
  110. the registered ECHOSPEECH shareware package.
  111.  
  112. The distribution contains an install program
  113.   
  114.   INSTALL.BAT
  115.  
  116. the program files
  117.   
  118.   WAV2ES.X87
  119.   WAV2ES.EMU
  120.   ES2WAV.EXE
  121.   ISFPP.EXE
  122.  
  123. and the documentation files
  124.   
  125.   LICENSE.DOC
  126.   REGISTER.DOC
  127.   MANUAL.DOC
  128.   ORDER.DOC
  129.  
  130. You can place the ECHOSPEECH files in any convenient
  131. subdirectory, or you can make a new subdirectory, like "\ECHO",
  132. for example, and put them there.
  133.  
  134. To install ECHOSPEECH, connect to the subdirectory where you put
  135. the ECHOSPEECH files and run the installation program,
  136. INSTALL.BAT.  INSTALL will remind you that this version of
  137. ECHOSPEECH is shareware, determine whether or not your system has
  138. a math coprocessor, and copy the distribution files
  139. appropriately.
  140.  
  141. The small program ISFPP.EXE is used by INSTALL.BAT to detect the
  142. presence or absence of a math coprocessor.
  143.  
  144.  
  145. Running ECHOSPEECH
  146.  
  147. Compressing a speech file:
  148.  
  149. To convert a Windows .WAV file containing speech sampled at
  150. 11.025 KHz to a compressed ECHOSPEECH file, type the following
  151. command:
  152.  
  153. wav2es infile [outfile]
  154.   
  155.   wav2es - is the ECHOSPEECH coder program name.  The
  156.   installation will have created the proper version of this
  157.   program based on whether or not your system has a math
  158.   coprocessor.
  159.   
  160.   infile - is the path to the input file to be compressed.  This
  161.   file must be a Windows .WAV file which has been recorded at
  162.   11.025 KHz.  The .WAV extension is an optional part of the file
  163.   name on the command line and .WAV will be assumed automatically
  164.   by the wav2es program in the absence of another extension.
  165.   
  166.   [outfile] - is the optional output file name.  If this argument
  167.   is omitted from the command line, wav2es will use the complete
  168.   infile path and file name, and will begin the output file name
  169.   with the character "_".
  170.  
  171. For example, the command:
  172.   
  173.   wav2es c:\speech\sample
  174.  
  175. will cause the wav2es program to compress a file called
  176. sample.wav which is located in the subdirectory c:\speech.  The
  177. compressed file will be saved as c:\speech\_sample.wav.  The
  178. wav2es program will always verify before overwriting an existing
  179. file and give you the option of entering an alternative file
  180. name.
  181.  
  182. Decompressing a speech file:
  183.  
  184. To convert a compressed ECHOSPEECH file to a decompressed Windows
  185. .WAV  file, type the following command:
  186.  
  187. es2wav [/8] infile [outfile]
  188.   
  189.   es2wav - is the ECHOSPEECH decoder program.
  190.   
  191.   [/8] - This optional command line parameter tells the es2wav
  192.   program to create an 8-bit output file (see the warning
  193.   regarding 8-bit files below).  If you omit this parameter
  194.   es2wav will create a 16-bit file.
  195.   
  196.   infile - is the path to the input file to be decoded.  This
  197.   file must be a Windows .WAV file which has been previously
  198.   coded by the wav2es program.  You can omit the .WAV extension
  199.   as a part of the infile expression.
  200.   
  201.   [outfile] - is the optional output file name.  If this argument
  202.   is omitted from the command line, es2wav will use the complete
  203.   infile path, removing any initial "_" character from the file
  204.   name, as the output file name.
  205.  
  206. For example, the command:
  207.  
  208.   es2wav /8 c:\sample\_speech
  209.  
  210. Will cause the es2wav program to decompress the file
  211. c:\sample\_speech.wav and store the decompressed file as
  212. c:\sample\speech.wav in 8-bit format.  If the original speech.wav
  213. file still exists in the c:\sample subdirectory, es2wav will ask
  214. you if it can be overwritten, and if not it will give you the
  215. opportunity to supply an alternate file name.
  216.  
  217. A Warning About 8-Bit Speech
  218.  
  219. ECHOSPEECH will compress speech files consisting of 8-bit speech
  220. samples, and generate files with 8-bit speech samples when it
  221. uncompresses.  However, ECHOSPEECH and other speech compression
  222. algorithms work much better on files of 16-bit speech samples.
  223.  
  224. If you have a 16-bit sound card, the results will be much better
  225. if you record the speech using 16-bit samples rather than 8-bit
  226. samples, and if you use 16-bit samples for the uncompressed
  227. speech output from ECHOSPEECH.
  228.  
  229.  
  230. A Word About ECHOSPEECH Frames
  231.  
  232. ECHOSPEECH compresses and uncompresses speech in units called
  233. "frames."  An ECHOSPEECH "frame" is 147 samples long.  Why did we
  234. pick 147 samples?  Because ECHOSPEECH was designed to process 75
  235. frames of speech per second, which corresponds to 147 samples per
  236. frame.  A rate of 75 frames per second works well with CD-ROMs
  237. and other media.
  238.  
  239. That means that ECHOSPEECH will ignore up to 146 samples at the
  240. end of the input raw speech file, and that output speech files
  241. will contain a multiple of 147 samples of speech data.
  242.  
  243.  
  244. Getting The Best Results With ECHOSPEECH
  245.  
  246. Remember: "garbage in, landfill out."  The better the input, the
  247. better job ECHOSPEECH can do in retaining the quality of the
  248. speech.
  249.  
  250. o Use good audio recording techniques.  Try to record speech with
  251. as little background noise, hum, distortion and other extraneous
  252. sound as possible.  Watch the gain and don't clip the speech.
  253. Use a 16-bit sound card for recording if at all possible.
  254.  
  255. o Avoid multiple voices.  ECHOSPEECH can only handle one person
  256. speaking at a time.
  257.  
  258. o If possible, don't use speech which has previously been
  259. compressed and decompressed.  Like multiple generations of tape
  260. recordings, some quality will be lost each time.
  261.  
  262. o Don't normalize the speech to full range -- this can
  263. occasionally cause glitches in the output speech.  90% of full
  264. range is almost always OK.
  265.  
  266. o Unlike some speech compression packages, ECHOSPEECH works just
  267. fine on high-piched voices -- don't hesitate to use them.
  268.  
  269. o ECHOSPEECH also works well on speech which has had its dynamic
  270. range compressed.
  271.  
  272. o ECHOSPEECH may work on some non-speech sounds, and if you like
  273. what you get, that's great, but ECHOSPEECH is a speech coder, not
  274. an audio coder.
  275.  
  276.  
  277. Possible Problems
  278.  
  279. Even though a lot of effort has been spent perfecting ECHOSPEECH,
  280. an occasional minor but audible glitch in the output speech is
  281. possible  Some glitches are due to the fact that ECHOSPEECH
  282. processes speech in units of frames.
  283.  
  284. Audible glitches can sometimes occur when the speech waveform is
  285. changing quickly at or near a boundary between frames.  Many of
  286. these can be eliminated simply by adding or removing a number of
  287. zero samples (say 50 to 75) at the beginning of the speech file.
  288.  
  289. Other glitches may result when the input speech has been clipped
  290. or otherwise distorted.
  291.  
  292. Comments about ECHOSPEECH can be sent to comment@echospeech.com
  293.